火星上有多大可能存在生命? 电子的质量是 $9.1 \times 10^{-31} \mathrm{~kg}$ 的概率是多大? 1816 年 7 月 9 号是晴天的概率是多少?
值得注意的是,类似火星上是否龵生命这种同 题的答案是二值化的,但我们关心的是,基于现有数据以及我们对火星物理脚尖和生物条件的了解, 火星上存在生命的概率有多大。该命題取决于我们当前所掌握的信息而非客观的自然属性。
我们使用概率是因为我们对事件不确定,而不代表事件本身是不确定的。由于这种概率的定义取决于我们的认知水平,有时也被称为概率的主观定义,这也就解释了为什么贝叶斯派总被称作主观统计。然而, 这种定义并不是说所有命题都是同等有意义的,仅是承认我们对世界的理解是基于现有的数据和模型, 是不完备的。
不基于模型或理论去理解世界是不可能的。 即使我们能脱离社会预设, 最终也会受到生物上的限制:受进化过程影响,我们的大脑已经与世界上的模型建立了联系。我们注定要以人类的方式去思考,永远的就是对其进行概率性描述。需要注意的是,不管世界的本原是确定的还是随机的,我们都将概率作为衡量不确定性的工具。
逻辑是指如何有效地推论, 在亚里士多德学派或者经典的逻辑学中, 一个命题只能是对或者错, 而在贝叶斯学派定义的概率中, 确定性只是概率上的一种特殊情况: 一个正确命题的概率值为 1 , 而一个错误命题的概率值为 0。
只有 在我们拥有充分的数据表明火星上存在生物生长和繁殖时, 我们才认为 “火星上 存在生命” 这一命题为真的概率值为 1 。不过, 需要注意的是, 认定一个命题的概率值为 0 通常是比较困难的, 这是因为火星上可能存在某些地方还没被探测 到, 或者是我们的实验有问题, 又或者是某些其他原因导致我们错误地认为火星上没有生命而实际上有。与此相关的是克伦威尔准则 (Cromwell's Rule), 其含义是指在对逻辑上正确或错误的命题赋予概率值时, 应当避免使用 0 或者 1。有意思的是, 考克斯 (Cox) 在数学上证明了如果想在逻辑推理中加入不确定性, 我们就必须使用概率论的知识, 由此来说, 贝叶斯定理可以视为概率论逻辑上的结果。因此, 从另一个角度来看, 贝叶斯统计是对逻辑学处理不确定性问题的一种 扩充, 当然这里毫无对主观推理的轻蔑。现在我们已经熟悉了贝叶斯学派对概率的理解, 接下来就了解下概率相关的数学特性吧。
概率值介于 $[0,1]$ 之间(包括 0 和 1), 其计算遵循一些法则, 其中之一是乘法法则: $$ p(A, B)=p(A \mid B) p(B) $$ 上式中, $A$ 和 $B$ 同时发生的概率值等于 $B$ 发生的概率值乘以在 $B$ 发生的条件下 $A$ 也发生的概率值, 其中, $p(A, B)$ 表示 $A$ 和 $B$ 的联合概率, $p(A \mid B)$ 表示条件概率, 二者的现实意义是不同的, 例如, 路面是湿的概率跟下雨时候路面是湿的概率是不同的。条件概率可能比原来的概率高, 也可能低。如果 $B$ 并不能提 、供任何关于 $A$ 的信息, 那么, $p(A \mid B)=p(A)$, 也就是说, $A$ 和 $B$ 是相互独立的。 相反, 如果事件 $B$ 能够给出关于事件 $A$ 的一些信息,那么根据事件 $B$ 提供的信 、息不同, 事件 $A$ 可能发生的概率会变得更高或是更低。
条件概率是统计学中的一个核心概念, 接下来我们将看到, 理解条件概率对于理解贝叶斯理论至关重要。这里我们换个角度来看条件概率, 假如我们把前面的公式调整下顺序, 就可以得到下面的公式: $$ p(A \mid B)=\frac{p(A, B)}{p(B)} $$ 需要注意的是, 我们不对 0 概率事件计算条件概率, 因此, 分母的取值范围为在已经知道事件 $B$ 发生的条件下,我们考虑的可能性空间就缩小到了事件 $B$ 产生生的范围内, 然后将该范围内 $A$ 发生的可能性除以 $B$ 发生的可能性便得到了条件概率 $p(A \mid B)$ 。
需要强调的是,所有的概率本质上都是条件概率,世间并没有绝对的概率。不管我们是否留意, 在谈到概率时总是存在这样或那样的模型、假论或条件。比如, 当我们讨论明天下雨的概率时, 在地球上、火星上甚至宇宙中其他地方明天下雨的概率是不同的。同样, 硬币正面朝上的概率取决于我们对硬币有偏性的假设。
参考资料: